Challenge: ccv1

Deep Learning: Was versteckt sich da?

Explorative Datenanalyse

Inhalt:

  1. CSV Daten lesen (Train, Test, Label)
  2. Die Klassifikation Tierarten
  3. Bilddaten Lesen (Train)
    1. Benchmark Ansicht
    2. Random Ansicht
    3. Problematische Bilder
  4. Verteilungen der Tierklassen
  5. Analyse zu Kamera Standorte (site ID)
    1. Verteilung der Bilder je Standort (Train)
    2. Plotten der Bilder je Standort
  6. Analyse zur Bildauflösung
    1. Bilder und Bittiefe
  7. Spezifische Kamermerkmale
    1. Bild bearbeitung durch zuschneiden
    2. Weitere Merkmale
    3. Analysieren von Kamerastandorte
  8. Augmentation Test

CSV Daten Lesen (Train, Test, Label)

Die CSV's beinhalten die Bild ID, Bildpfad, Aufnahmeort ID und die Tierklassifikation (Training)

Die Klassifikation Tierarten

Klassifikation findet für 8 Tierarten statt

Die Klassen 'bird', 'rodent' umfassen mehrere Tierartren. Die Klasse'blank' steht für ein Bild ohne ein Tier. Die übrigen Tierklassen sind im obigen Bild enthalten.

Bilddaten Lesen (Train)

Probeansicht Bilder (quelle: benchmark file)

Random Ansicht

Zelle mehrmals ausführen um unterschiedliche Bilder zu erhalten

Problematische Bilder

Folgend wurden spezifisch Bilder herausgesucht um die Problematik von schlechten Bilder zu zeigen.

Zu Prüfen: wenn die Bilder im Notebook mit den Bilder im File Ordner verglichen werden, fällt auf dass die Bilder in der Windowsansicht schwarz-weiss im Notebook blau-gelb angezeigt werden. Beispiel 'ZJ003494'.
Interpretation von mpimg prüfen.

Verteilungen der Tierklassen

(Quelle: Benchmark) Wie im Benchmark Notebook beschrieben, entspricht die Tierklassen Verteilungen nicht dem eigentlichen Vorkommen. Die (Trainings)daten wurden für die Competition bereits vorbereitet.

Analyse zu Kamera Standorte (site ID)

Verteilung der Bilder je Standort (Train)

Insgesamt bestehen 148 verschiedene Kamera Standorte. Die ID-Nummerierung verläuft von S0001 bis S0198 (ID-Nummerierung nicht komplet durch numeriert). Die Verteilung zeigt die Anzahl Bilder die für einen Standort zur Verfügung stehen. Einige Standorte nehmen nur sehr wenige Bilder auf (1-2) ander enthalten hunderte Bilder.

Plotten der Bilder je Standort

Analyse zu Bildauflösung

Hier soll geprüft werden wie stark die Auflösungen der Kameras varrieren.

Die Auflösungen kann mit 'mpimg' durch shape wiedergegeben werden. Eine schneller Möglichkeit ist 'Pillow' zu verwenden, die Bittiefe muss jedoch seperate mit 'getbands()' ausgelesen werden.

getbands()

Über 80% der Bilder haben die Auflösung (640, 360) oder (960, 540)

Bilder und Bittiefe

Untersuchen der Bittiefe

Spezifische Kameramerkmale

Am unteren Rand haben viele Bilder das gleiche Logo und Zeitstempfel. Auf verschiedenen Bildern wurden diese teilweise durch beschneiden entfernt. Hier soll untersucht werden:

Bild bearbeitung durch zuschneiden

Die neun Testbilder gehören alle zu beiden Hauptgruppen der Bildauflösungen, (640x360) und (960x540)

Die neun Testbilder, bei denen das Logo und Zeitstempfel teilweise entfernt wurde, haben jeweils eine Beschneidung in der Dimension 'height'. Daraus könnte geschlossen werden dass die bearbeiteten Bilder der Hauptgruppe angehören jedoch mit fehlendem unterem Abschnitt, (640x360) -> (640x335) und (960x540) -> (960x515)

Weitere Bildauflösungs Merkmale

Analysieren von Kamerastandorte

Augmentation Test

Hier soll versucht werden ob das Logo im linken unteren Teil des Bildes automatisch erkannt werden kann

Tests